Agenda
Revisando inferencia estadística clásica frecuentista
La meta es reportar un estimado puntual y su incertidumbre asociada.
Estimación puntual
La estimación puntual es el valor más probable del parámetro que podemos “adivinar” en base a los datos de la muestra que tenemos.
Que sea nuestra mejor apuesta no lo hace lo mejor del mundo. Es solo lo que podemos decir con lo que tenemos, nada más ni nada menos.
Incertidumbre asociada
Siempre hay incertidumbre asociada a la estimación, podemos indicar qué tan incierta es nuestra estimación a través de dos procedimientos:
Prueba de hipótesis: Valor p actúa como una medida de incertidumbre que, asumiendo ciertos puntos de corte, me permite tomar postura sobre el parámetro.
Estimación de intervalo: Intervalo de confianza da rango de valores plausibles que podrían ser compatibles con el valor del parámetro si y solo si el intervalo captuar el verdadero valor (recordar: ¡siempre existe la posibilidad de que no lo capture!).
Independientemente de la distribución de la variable respuesta, lo que queremos estimar es una medida de resumen de esta variable en la población: media, mediana, difernecia de medias, diferencia de medianas, razón de odds, razón de riesgos, etc.
En cada muestra, en cambio, el estadístico que se calcula (media, mediana, diferencia de medias, razón de odds, etc.) no es fijo.
En realidad no importa qué distribución tenga la variable respuesta, en cuanto podamos estimar bien el parámetro y su incertidumbre asociada a la estimación.
Para estimar bien el parámetro requerimos un estimador que sea insesgado.
Insesgado siempre: Estimador insesgado
Insesgado si y solo si n es grande: Estimador consistente.
Para estimar bien la incertidumbre necesitamos conocer la distribución de los estadísticos que genera el estimador.
En la práctica habitual, no es posible calcular el error estándar real
Si tuviera todas las muestras posibles, lo calcularía directamente.
En la práctica real, solo tengo una muestra (ni dos, ni tres, ni mucho menos todas…)
No podemos dibujar la distribución muestral real.
Mucho menos calcular la varianza / error estándar “real” del estimador (por el motivo anterior)
En la práctica habitual, sí podemos estimar el error estándar.
Cálculo del valor p e IC requieren de la varianza del estimador.
Sea \(\beta\) una diferencia de medias de interés.
Valor p para \(\hat{\beta}\):
\[T_{calculado} = \frac{\hat{\beta}-\beta_{0}}{SE(\hat{\beta})}\]
- Luego, se asume que si H0 es cierta y TLC se cumple, el T calculado sigue una distribución t de Student.
\[\text{Límite del IC} = \hat{\beta} ± t_{1-\alpha/2 \text{, gl}}SE(\hat{\beta})\]
- Aquí también se asume que si TLC se cumple, la distribución t permite construir un IC.
Descargue la carpeta denominada taller06 disponible en la carpeta compartida.
Abra el proyecto denominado taller06.Rproj
Complete y ejecute el código faltante en los chunk de código.
Una vez culmine todo el proceso, renderice el archivo .qmd.
https://github.com/psotob91
percys1991@gmail.com
R Aplicado a los Proyectos de Investigación - Sesión 7